Search results for "programación dinámica"

showing 2 items of 2 documents

Aprendizaje por refuerzo en espacios continuos: algoritmos y aplicación al tratamiento de la anemia renal

2014

El aprendizaje por refuerzo es un paradigma de aprendizaje automático orientado a la resolución de problemas de decisión secuenciales. Este tipo de problemas aparece en aplicaciones pertenecientes a campos tan diversos como control automático, medicina, investigación operativa o economía. Los algoritmos clásicos de aprendizaje por refuerzo están fundamentados en la teoría matemática de la programación dinámica, donde se asume que el espacio de estados es discreto y se compone de un número manejable de estados. Desafortunadamente, en la mayoría de aplicaciones de interés práctico el espacio de estados es continuo, por lo que los algoritmos clásicos dejan de ser útiles. Para poder aplicar el …

:MATEMÁTICAS::Ciencia de los ordenadores::Inteligencia artificial [UNESCO]aprendizaje por refuerzo:MATEMÁTICAS::Estadística::Análisis de datos [UNESCO]programación dinámicaaprendizaje automáticoanálisis de datosUNESCO::MATEMÁTICAS::Estadística::Análisis de datosUNESCO::MATEMÁTICAS::Ciencia de los ordenadores::Inteligencia artificial
researchProduct

Estabilización de modelos económicos dinámicos con control óptimo en tiempo continuo

1990

En esta Tesis de Licenciatura se lleva a cabo el estudio de un problema determinado de optimización dinámica y sus aplicaciones en el campo de la Ciencia Económica. Un problema de optimización consiste, fundamentalmente, en la búsqueda de un extremo de una función o un funcional objetivo que proporcione un máximo o un mínimo para esa función. Cuando se habla de optimización dinámica hay que incorporar el factor tiempo al problema, en todas y cada una de las diferentes variables que intervienen, lo que afectará a los modelos matemáticos que se empleen para representar el comportamiento y las relaciones existentes entre dichas variables. También afecta al funcional objetivo a optimizar. Así, …

continuous timeUNESCO::MATEMÁTICAS::Investigación operativa::Inventariostiempo continuoUNESCO::CIENCIAS ECONÓMICASUNESCO::CIENCIAS ECONÓMICAS::Teoría económicaUNESCO::MATEMÁTICAS::Investigación operativa::Sistemas de controlcontrol óptimostabilizationoptimal controlUNESCO::CIENCIAS ECONÓMICAS::Teoría económica::Teorías de la estabilizaciónUNESCO::MATEMÁTICAS::Investigación operativa::Programación dinámicadynamical systems in Economicsestabilizaciónmodelos económicos dinámicos
researchProduct